********************************************************************************
***																			 ***
***     				  PERU - WOMEN COVID19 PROJECT 						 ***
***						   PILOT FIRST ROUND SURVEY					         ***
***																			 ***
********************************************************************************


/*** Defines global
	 ***************************************************************************/



use ubigeo c5_p19_cod c5_p20_cod using "$data_folder/censo17/CPV2017_POB.dta", clear 
renam c5_p19_cod ocupacion
renam c5_p20_cod actividad

drop if missing(ocupacion)
drop if missing(actividad)


**************************************************
****AGRUPAMOS EN 22 SECTORES
**************************************************
rename actividad p506r4
destring p506r4, replace

** Sectores Completos a CIIU Rev.4
* Actividad económica
gen sector1r4=.
replace sector1r4=1 if p506r4>=100 & p506r4<300
replace sector1r4=2 if p506r4>=300 & p506r4<500
replace sector1r4=3 if p506r4>=500 & p506r4<1000
replace sector1r4=4 if p506r4>=1000 & p506r4<3500
replace sector1r4=5 if p506r4>=3500 & p506r4<3600
replace sector1r4=6 if p506r4>=3600 & p506r4<4100
replace sector1r4=7 if p506r4>=4100 & p506r4<4500
replace sector1r4=8 if p506r4>=4500 & p506r4<4900
replace sector1r4=9 if p506r4>=4900 & p506r4<5500
replace sector1r4=10 if p506r4>=5500 & p506r4<5800
replace sector1r4=11 if p506r4>=5800 & p506r4<6400
replace sector1r4=12 if p506r4>=6400 & p506r4<6800
replace sector1r4=13 if p506r4>=6800 & p506r4<6900
replace sector1r4=14 if p506r4>=6900 & p506r4<7700
replace sector1r4=15 if p506r4>=7700 & p506r4<8400
replace sector1r4=16 if p506r4>=8400 & p506r4<8500
replace sector1r4=17 if p506r4>=8500 & p506r4<8600
replace sector1r4=18 if p506r4>=8600 & p506r4<9000
replace sector1r4=19 if p506r4>=9000 & p506r4<9400
replace sector1r4=20 if p506r4>=9400 & p506r4<9700
replace sector1r4=21 if p506r4>=9700 & p506r4<9900
replace sector1r4=22 if p506r4==9900 

#delimit ;
lab def sector1r4 
1 "Agricultura, ganadería y silvicultura" 
2 "Pesca y acuicultura" 
3 "Explotación de minas y canteras" 
4 "Industrias manufactureras" 
5 "Suministro de electricidad, gas, vapor y aire acondicionado"
6 "Suministro de agua; evacuación de aguas residuales, gestión de desechos y descontaminación" 
7 "Construcción" 
8 "Comercio al por mayor y al por menor; reparación de vehículos automotores y motocicletas" 
9 "Transporte y almacenamiento" 
10 "Actividades de alojamiento y de servicio de comidas" 
11 "Información y comunicaciones" 
12 "Actividades financieras y de seguros" 
13 "Actividades inmobiliarias"
14 "Actividades profesionales, científicas y técnicas" 
15 "Actividades de servicios administrativos y de apoyo" 
16 "Administración pública y defensa; planes de seguridad social de afiliación obligatoria " 
17 "Enseñanza" 
18 "Actividades de atención de la salud humana y de asistencia social" 
19 "Actividades artísticas, de entretenimiento y recreativas" 
20 "Otras actividades de servicios"
21 "Actividades de los hogares como empleadores; actividades no diferenciadas de los hogares como productores de bienes y servicios para uso propio"
22 "Actividades de organizaciones y órganos extraterritoriales"; 
#delimit cr
lab val sector1r4 sector1r4


***Sectorial share by ubigeo by sector
rename ubigeo2019 ubigeo
gen frequency=1

sort ubigeo sector1r4 p506r4, stable
bysort ubigeo sector1r4: egen total_labor_sector=total(frequency)

sort ubigeo sector1r4 frequency, stable
bysort ubigeo : egen total_labor_dist=total(frequency)

*Shares
gen share_ubigeo=total_labor_sector/total_labor_dist

**
duplicates drop ubigeo sector1r4, force
drop p506r4 frequency
drop ocupacion

**
sort ubigeo sector1r4
save "$inputs_bartik\census2017_sector_shares.dta", replace
